Fouille de graphes sous contraintes linguistiques pour l'exploration de grands textes (Graph Mining Under Linguistic Constraints to Explore Large Texts) [in French]

نویسندگان

  • Solen Quiniou
  • Peggy Cellier
  • Thierry Charnois
  • Dominique Legallois
چکیده

Graph Mining Under Linguistic Constraints to Explore Large Texts In this paper, we propose an approach to explore large texts by highlighting coherent sub-parts. The exploration method relies on a graph representation of the text according to the Hoey linguistic model which allows the selection and the binding of sentences in the graph. Our contribution relates to using graph mining techniques under constraints to extract relevant subparts of the text (i.e., collections of homogeneous sentence sub-networks). We have conducted some experiments on two large English texts to show the interest of the proposed approach. MOTS-CLÉS : Fouille de graphes, réseaux phrastiques, analyse textuelle, navigation textuelle.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Extraction sous contraintes d'ensembles de cliques homogènes

Résumé. Nous proposons une méthode de fouille de données sur des graphes ayant un ensemble d’étiquettes associé à chaque sommet. Une application est, par exemple, d’analyser un réseau social de chercheurs co-auteurs lorsque des étiquettes précisent les conférences dans lesquelles ils publient. Nous définissons l’extraction sous contraintes d’ensembles de cliques tel que chaque sommet des clique...

متن کامل

Multi-catégorisation de textes juridiques et retour de pertinence

Résumé. La fouille de données textuelles constitue un champ majeur du traitement automatique des données. Une large variété de conférences, comme TREC, lui sont consacrées. Dans cette étude, nous nous intéressons à la fouille de textes juridiques, dans l’objectif est le classement automatique de ces textes. Nous utilisons des outils d’analyses linguistiques (extraction de terminologie) dans le ...

متن کامل

Approche biomimétique coopérative pour la visualisation de grands graphes multidimensionels

Face à la quantité sans cesse grandissante de données stockées, les algorithmes de fouille et de visualisation de données doivent pouvoir être capable de traiter de grandes quantités de données. Une des solutions est d’effectuer un prétraitement des données permettant la réduction de la dimension des données sans perte significative d’informations. L’idée est donc de réduire l’ensemble de descr...

متن کامل

Panorama de quelques approches récentes pour la classification non supervisée de graphes

Résumé. Les avancées technologiques récentes ont permis d’acquérir dans de nombreux domaines des corpus de graphes. Une problématique en plein essor consiste à classer ces données complexes pour établir des typologies. Différentes approches développées en fouille de données sont présentées dans cet article: la visualisation de graphes dans une perspective exploratoire, la caractérisation des gr...

متن کامل

Analyse des grands graphes de terrain

Dans de nombreux contextes, il est naturel et pertinent de représenter (une partie de) l’information étudiée sous forme de relations entre objets ; parfois l’information disponible se réduit même essentiellement à un tel ensemble de relations. Dans tous les cas, on se retrouve confronté à des graphes qui ne sont pas issus d’une modélisation mathématisée, mais qui représentent des données réelle...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012